iT邦幫忙

2021 iThome 鐵人賽

DAY 17
0

今天我們要介紹的是機器學習,所謂的機器學習是指著重於訓練電腦從資料中學習,並根據經驗改進且在機器學習中會訓練演算法尋找大型資料集的模式和關聯性,並根據該分析做出最佳決策和預測,機器學習應用程式會隨著使用不斷改善,存取的資料越多、準確度越高,而機器學習在生活上的範圍也很多,例如:應用於我們的家中、購物車、娛樂媒體,以及醫療保健業等。

機器學習

機器學習的種類大致分為以下幾種監督式、非監督式、半監督式或強化式四種學習模式而在每個模式下都可以套用一種或多種的演算法,而機器學習演算法主要用於分類事物、辨識模式、預測結果,並做出周全的判斷,在分析複雜的資料時可以使用不同的演算法也可以用不只一種的演算法,以下我們稍微介紹一下四種的學習模式。

監督式學習

所謂的監督式學習是指一對一的比照方式,間單來說就是電腦從標籤化的資訊中分析模式後做出預測的學習方式,標記過的資料就像標準答案,電腦在學習的過程透過對比誤差,一邊修正去達到更精準的預測,這樣的方式讓監督式學習有準確率高的優點,監督式學習方式需要倚靠大量的事前人工作業,將所有可能的特質標記起來,這過程相當繁複,當範圍擴大、資訊量增加,會更難去對資料標記出所有特徵,所以在面對未知領域時,幾乎是完全無法運作,舉個例子就像我們一些貓狗類的照片分別幫他標記,丟進一張照片時讓機器去分析出一個解答,然後將其跟正解對比來看是否有分析錯誤並加以改進,這樣就是我們所謂的監督式學習。

非監督式學習

所謂的非監督式學習是指讓機器自行摸索出資料規律,在非監督式學習的訓練資料跟監督式學習的不同是在於資料不需要事先以人力處理標籤,機器面對資料時,做的處理是依照關聯性去歸類、找出潛在規則與套路、形成集群,不對資訊有正確或不正確的判別,非監督式學習的特性讓它在資料探勘初期是個好用的工具,對比監督式學習來說非監督式學習可以大大減低繁瑣的人力工作,找出潛在的規則,但這樣的方式,也會造成較多功耗,甚至也可能造成不具重要性的特徵被過度放大,導致結果偏誤、無意義的分群結果,比如說我們將多張貓狗的照片丟入,讓機器自行摸索,例如可能大隻的是狗狗或著說狗狗的尾巴毛比貓咪多,但不給正確的解答,而在丟新的照片時如果有以上的特徵,那機器就會將那張照片歸類為狗狗。

半監督式學習

所謂的半監督式學習是指有監督式與非監督式的特質,半監督式學習對少部分資料進行標記,電腦只要透過有標記的資料找出特徵並對其它的資料進行分類,這種方法可以讓預測時比較精準,也是目前最常用的一種方式,對於我們來說要取得有標記的資料會比取得沒有標記的資料來的困難,就像我們會知道照片是狗是貓但不一定每張照片都會知道他的品種,所以對於我們來說要取得資料簡單,但要取得有標記的資料較為困難,而非監督式學習的方法就是我們標記一些少數的資料,然後讓機器去學習少數的資料進而讓他可以分析沒有標記的資料,這樣的方式相對於非監督式學習的方式來的準確,因為非監督式有可能將一些錯誤的特徵歸類為正確但也因為都沒給正確解答所以會倒致分析的錯誤,但半監度式學習的方式一開始會有些正確的資料可以做依據跟學習,所以會比非監督式來的好,例如我們將一堆貓狗照片丟進去但將某些貓狗的照片給予標記,讓機器可以先學習那些正確照片在去分析沒有標記的照片。

強化式學習

所謂的強化式學習是指在未知探索與遵從既有知識間取得平衡,強化式學習的特徵是不需給機器任何的資料,讓機器直接從互動中去學習,這是最接近人類原本的學習方式,機器透過環境的正向、負向回饋當中,自我學習並逐步形成對回饋的預期,做出越來越有效率達成目標的行動,這個訓練過程的目標是獲取最大利益,簡單來說運用強化式學習的方式,我們不標註任何資料,但告訴它所採取的哪一步是正確、那一步是錯誤的,根據反饋的好壞,機器自行逐步修正、最終得到正確的結果,能使非監督式學習達成一定程度的正確性,就不能缺少強化式學習的方式,透過一次一次正確與錯誤的學習,最後的預測就會越來越精準,例如我們將一些貓狗的照片丟進去,但我們不去告訴機器貓狗有哪些特徵,而是在機器分析出來特徵的時候,我們給予解答,也許是正確也許是錯誤,但機器就可以在當中學習,而達到說下次再做到這項分析時可以知道這項分析的錯誤與否,達到在比非監督式學習有更好的準確性。

以上就是簡易的機器學習介紹,明天我們將介紹機器學習的方法。


上一篇
Day 16 編輯器 — VSCode
下一篇
Day 18 決策樹
系列文
新手也想開始認識機器學習30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言